# _*_ coding : utf-8 _*_
# @Time : 2023/12/11 16:23
# @Author : 韩宗森
# @File : 22_bs4的基本使用
# @Project : pythonProject

from bs4 import BeautifulSoup

# 通过解析本地文件  来将bs4的基础语法进行讲解
# 默认打开的文件的编码格式是gbk 所以在打开文件的时候需要指定编码
soup = BeautifulSoup(open('1_页面结构.html', encoding='utf-8'), 'lxml')

# 根据标签名查找节点

# 找到的是第一个符合条件的数据
# print(soup.a)

# 获取标签的属性和属性值
# print(soup.a.attrs)

# bs4的一些函数

# (1) find
# 返回的是第一个符合条件的数据
# print(soup.find('a'))
# 根据title的值来找到对应的标签对象
# print(soup.find('a', title="t2"))

# 根据class的值来找到对应的标签对象―注意的是class需要添加下划线
# print(soup.find('a', class_="c3"))

# （2) find_all返回的是一个列表并且返回了所有的a标签
# print(soup.find_all('a'))

# 如果想获取的是多个标签的数据那么需要在find_all的参数中添加的是列表的数据
# print(soup.find_all(['a','span']))

# limit的作用是查找前几个数据
# print(soup.find_all('li', limit=2))

# ( 3 ) select (推荐)
# select方法返回的是一个列表并且会返回多个数据
# print(soup.select('a'))

# 可以通过.代表class我们把这种操作叫做类选择器
print(soup.select('.c3'))
